Reporte

Agustin Lehmann, Gabriel Szerman, Ernesto Mercado, Ignacio Gallego

En este reporte analizaremos el uso del sistema Ecobici en la Ciudad de Buenos Aires durante el año 2022.

Utilizaremos un dataset específico que consta de 10,000 observaciones seleccionadas de un conjunto de datos mucho más extenso, compuesto por casi 3 millones de registros. Este dataset nos permitirá examinar patrones y tendencias en la utilización de Ecobici. Además, complementaremos este análisis con datos meteorológicos y climáticos de la estación meteorológica de Aeroparque (ID 87582), recopilados desde el 1ro de enero hasta el 31 de diciembre de 2022.

La integración de estos conjuntos de datos nos brindará una visión enriquecedora para comprender mejor la relación entre el uso de Ecobici y las condiciones climáticas en la Ciudad de Buenos Aires

Descripcion de los Datasets

Clima

Esta conformado por las siguientes columnas:

  • fecha: fecha del registro.

  • tmin, tavg ,tmax: Temperaturas minima, maxima, y promedio del dia.

  • prcp: Precipitacion en mm.

  • wdir, wspd: Direccion y velocidad del viento respectivamente.

  • pres: Precion atmosferica en hPa.

Tambien teniamos las columnas snow wpgt y tsun las cuales decidimos quitar porque estaban compuestas al 100% de nulos asi como tambien reemplazar los nombres de las columnas por algo mas claro.

Descripcion de los Datasets

Bicis

Esta conformado por las columnas:

  • id_recorrido, id_usuario: keys para identificar cada viaje y usuario distinto

  • duracion del recorrido: cuanto duro el viaje (en segundos).

  • latitud / longitud de estacion origen/destino y nombres de las estaciones : datos geograficos sobre la ubicacion y el nombre de cada estacion

  • modelo_bici: que bici estaban usando.

  • genero: de que genero era el usuario.

  • fecha origen/destino, fecha: que dia y a que hora partio/llego y fecha del registro

Decidimos quitar el resto de las columnas ya que eran datos repetidos como la direccion o eran columnas de indice de cuando se redujo del dataset original.

Clima

Generalidades-Temperatura

Comenzamos analizando la temperatura.

La temperatura mas alta ocurrio en enero (37°C) y la mas baja en julio (2.3°C). Veamos las lluvias.

Clima

Generalidades-Lluvias

Se puede ver que hubo mayores precipitaciones en Febrero.

Clima

Generalidades-Viento

Hubo vientos mas fuertes en verano que en invierno.

Clima

Generalidades-Presion atmosférica

Si bien hubo mayor presion atmosferica en invierno, no vario mucho.

Bicis

Veamos como se ven afectados los viajes en el Dataset

Franja horaria

Analicemos cual es el horario en que se concentra la mayor cantidad de viajes.

Podemos ver que el horario de mayor concentración de viajes es entre las 16 y 18hs

Ahora analicemos para cada mes

Observamos que la tendencia se mantiene, exceptuando el mes de enero. Analicemos la cantidad de viajes a lo largo del año para ver si la cantidad de viajes disminuye en enero

Cantidad de viajes

La cantidad de viajes disminuye en el verano y el invierno siendo los puntos mas bajos las semanas del 9-1 al 29-1 en el verano y las semanas del 17 de julio y 31 julio en el invierno.

Por el contrario hay mas viajes en otoño y primavera, siendo la semana del 10 de abril y del 2 de octubre las semanas en las que hubo mas uso.

Respecto al análisis que veniamos haciendo, la cantidad total de viajes disminuye en enero y eso va de la mano con esa disminución de amplitud en el horario pico. Como dato llamativo, en invierno esa disminución en el horario pico, si bien también se da y coincide con la disminución en la cantidad total de viajes, esa disminución de amplitud en el horario pico es mucho mas leve.

Las lluvias afectan a la cantidad de viajes?

Se puede observar que mientras mas llueve hay menos viajes.

Viajes por dia de semana

General

Hay menos viajes los fines de semana, veamos si es todos los meses

Viajes por dia de semana

Mes a mes

No varia mes a mes

Estaciones de destino

Primer semestre

Podemos ver que en enero Plaza irlanda estaba primera, en febrero Guatemala, en marzo abril y mayo congreso y constitucion.

Segundo Semestre

En Julio Malabia y Azucena eran las mas populares, Pacifico estuvo entre las mas populares de agosto a octubre y Constitucion Topeo en diciembre, es posible que se deba a que se creia que iba a pasar la selecciónpor ahi cuando ganaron el mundial.

Estaciones de origen mas comunes, primer semestre

Ya en el primer semestre podemos ver como varia, en enero la estacion de origen mas usada es es Pacifico, pero febrero ya esta compartiendo el puesto con Plaza Bolivia. En marzo la mas usada fue Plaza Italia, el abril Retiro, en mayo un empate entre Congreso y Facultad de medicina y en junio Acuña de figueroa fue la mas usada.

Estaciones de origen mas comunes, segundo semestre

En el segundo semestre podemos ver mejor la tendecia que aparecia cuando tomabamos todo el año, a excepcion de julio y septiembre donde las mas usadas fueron Plaza Italia y Hospital de clinicas respectivamente, podemos ver que las 3 estaciones de origen mas usadas (Pacifico, Retiro y Constitucion) dominan en los otros meses.

Duracion de viajes

  • Hay 348 outliers con mas de 45mins de recorrido

  • la mayoria de las personas usa las bicis por menos de 45min

  • El tiempo promedio de uso es de 18 mins 42segs.

  • El tiempo medio de uso es de 16mins con 4 seg.

  • En invierno el promedio y la media de duracion de recorridos es mas baja.

  • En abril se ve que hubo una bajada en el tiempo de recorrido maximo y upper fence

Duracion de Viajes

Los viajes duran mas los fines de semana.

El clima afecta la duracion de los recorridos?

Veamos si las variables climaticas afectan la duración de los viajes

Las lluvias no parecen afectar del todo a las duraciones de los viajes.

Hay una leve tendencia hacia mas duracion a mas calor, pero es muy pequeña.

La temperatura afecta la cantidad de viajes diarios?

En conclusión, se puede ver una relación entre la temperatura y la cantidad de viajes ese día.

En particular, se puede observar que si la temperatura promedio es menor a 10°C o mayor a 25°C, la cantidad de viajes ese día disminuye.

Usuarios

Cantidad de viajes vs cantidad de usuarios

Podemos observar que el género masculino tiene una mayor proporción de repetición de viajes

Preferencia de modelo de bicicletas

General

Vamos a analizar cuales son los modelos de bicicletas mas utilizados y si hay algún patrón relacionado con otras variables

No se ve diferencia mas que el modelo mas utilizado es el modelo FIT.

Preferencia de modelo de bicicletas

Por dia de la semana

Analicemos el uso de cada modelo para ver si hay algun dia de la semana en que un modelo sea mas elegido que otro

La proporción parece mantenerse independientemente del dia de la semana.

Preferencia de modelo de bicicletas

Por Genero

Veamos si hay algún modelo que sea preferido en base al género.

La proporción parece mantenerse independientemente al genero.

Conclusión

Este análisis nos ha brindado una comprensión valiosa sobre la utilización del sistema Ecobici en la Ciudad de Buenos Aires durante el año 2022. A continuación, se presentan algunos hallazgos significativos derivados del análisis:

  • La franja horaria con mayor concentración de viajes es entre las 16:00 y las 18:00 horas. Este patrón se repite en todos los meses, excepto en enero. Es probable que esto se deba a la cantidad de lluvias, así como a un aumento significativo de la temperatura, factores que hemos observado que influyen en la cantidad de viajes. Es posible que las vacaciones también tengan un impacto temporal, aunque no disponemos de datos sobre esta variable.

  • La cantidad de viajes es mayor durante las temporadas de otoño y primavera, mientras que disminuye durante el invierno y el verano. Según nuestras observaciones, tanto las temperaturas extremadamente altas como bajas afectan la cantidad de viajes.

  • La mayoría de los viajes se concentran en la zona noreste y en el centro de la ciudad.

  • Las estaciones de salida más comunes son Constitución, Retiro y Pacífico, lo que indica un uso significativo de la combinación tren-bicicleta.

  • La duración promedio de un viaje es de 18 minutos y 42 segundos. Es más probable que las personas de género masculino realicen viajes repetidos.

  • Durante los fines de semana, hay menos viajes, pero estos son de mayor duración.

  • Hay mas viajes con el modelo FIT, y esto mantiene por el día de la semana y por el género.

Esta integración de datos y el análisis resultante pueden ser fundamentales para informar estrategias futuras y mejorar la eficiencia y accesibilidad del sistema Ecobici en la ciudad.